home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1997 December / Internet_Info_CD-ROM_Walnut_Creek_December_1997.iso / ietf / urn / urn-archives / urn-ietf.archive.9610 / 000064_owner-urn-ietf _Mon Oct 21 15:59:43 1996.msg < prev    next >
Internet Message Format  |  1997-02-19  |  4KB

  1. Received: (from daemon@localhost) by services.bunyip.com (8.6.10/8.6.9) id PAA28934 for urn-ietf-out; Mon, 21 Oct 1996 15:59:43 -0400
  2. Received: from mocha.bunyip.com (mocha.Bunyip.Com [192.197.208.1]) by services.bunyip.com (8.6.10/8.6.9) with SMTP id PAA28927 for <urn-ietf@services.bunyip.com>; Mon, 21 Oct 1996 15:59:40 -0400
  3. Received: from windrose.omaha.ne.us by mocha.bunyip.com with SMTP (5.65a/IDA-1.4.2b/CC-Guru-2b)
  4.         id AA23206  (mail destined for urn-ietf@services.bunyip.com); Mon, 21 Oct 96 15:59:38 -0400
  5. Message-Id: <9610211959.AA23206@mocha.bunyip.com>
  6. Received: by privateer.windrose.omaha.ne.us; Mon Oct 21 15:01 CDT 1996
  7. From: "Ryan Moats" <jayhawk@ds.internic.net>
  8. To: "Martin J Duerst" <mduerst@ifi.unizh.ch>,
  9.         "Patrik Faltstrom" <paf@swip.net>
  10. Cc: "urn-ietf@bunyip.com" <urn-ietf@bunyip.com>
  11. Date: Mon, 21 Oct 96 15:04:20 
  12. Priority: Normal
  13. X-Mailer: PMMail 1.52 For OS/2 UNREGISTERED SHAREWARE
  14. Mime-Version: 1.0
  15. Content-Type: text/plain; charset="us-ascii"
  16. Content-Transfer-Encoding: 7bit
  17. Subject: Re: [URN] Pre release of URN Syntax document....
  18. Sender: owner-urn-ietf@services.bunyip.com
  19. Precedence: bulk
  20. Reply-To: "Ryan Moats" <jayhawk@ds.internic.net>
  21. Errors-To: owner-urn-ietf@bunyip.com
  22.  
  23. On Mon, 21 Oct 1996 20:36:58 +0200 (MET DST), Patrik Faltstrom wrote:
  24.  
  25. >
  26. >On Mon, 21 Oct 1996, Martin J Duerst wrote:
  27. >
  28. >> The other big problem is equivalence. For Unicode, character equivalence
  29. >> is in some cases not the same as codepoint equivalence. Charecter
  30. >> equivalence is well defined, but there is currently no standard
  31. >> for normalization.
  32. >
  33. >What exists are the decomposition rules for Unicode. Those are well defined.
  34.  
  35. True, but I should probably add some stuff to section 3 about this.
  36.  
  37. >> This does not concern things such as case,
  38. >> where the user can easily distinguish lower case and upper case,
  39. >> but cases such as A-with-Grave, which can be encoded both as
  40. >> one single codepoint and as the sequence A, Grave.
  41. >
  42. >The casing is also defined in the Unicode spec.
  43. >
  44. >What you do is to first decompose the string (i.e. change
  45. >A-with-Grave into A, Grave), and then do the case insensitive
  46. >comparison (if you want to).
  47. >
  48. >All of this is implemented in the Digger Whois++ server from
  49. >Bunyip. It is doable!
  50.  
  51. Ah, yes but in the server, rather than in the client...
  52.  
  53. >> Another problem that should be considered are bidirectionality
  54. >> for Hebrew and Arabic.
  55. >
  56. >It should be defined, just like in MIME, that characters are
  57. >stored in the order they are stored, not displayed. (At least
  58. >I remember that we discussed this with display order in the
  59. >MIME community in an interesting meeting faaaar back in time,
  60. >which was ended by looking at some example where two hebrew
  61. >users, using the same computer, was using different display
  62. >order...).
  63.  
  64. I agree with Patrik.  Regardless of glyph direction order, NSS octets
  65. are in order of presentation ie. (for left->right, left most character first,
  66. for right->left right most character first, etc.)
  67.  
  68. >> It would be a good idea if URN resolvers could alos care about
  69. >> UNicode character equivalence. But maybe some schemes would do
  70. >> that easier than others?
  71. >
  72. >It is the resolution service that have to care about character
  73. >equivalence. The URN spec should only say UTF-8 from my point of
  74. >view. It could though be noted that A-with-grave and A, Grave in
  75. >Unicode is regarded as an example of equivalent characters.
  76.  
  77. I agree with Patrik again.  I have added the note.
  78.  
  79. Ryan
  80.